茶,作為世界上最古老的飲料之一,不僅有著令人愉悅的香味,更是承載著千年文化的象征。茶樹的種植面積和產(chǎn)量在全球范圍內(nèi)十分龐大,經(jīng)濟(jì)價(jià)值相當(dāng)可觀,是茶葉出口國和多個(gè)發(fā)展中國家消除貧困和糧食安全的重要保障。茶樹的育種工作也一直備受關(guān)注,然而傳統(tǒng)茶樹一直依賴于對自然變異和有價(jià)值的基因型重組的長期選擇。如何更加精確、高效地育種一直是茶樹育種家關(guān)注的焦點(diǎn)。
為此,科學(xué)家們提出了利用泛基因組(Pan-genome)輔助育種技術(shù),有望實(shí)現(xiàn)更快速地植物性狀改良。泛基因組包含更加全面的遺傳信息,可以有效降低參考基因組偏差對遺傳變異檢測的影響。通過該技術(shù),人們能夠更全面地了解植物的遺傳特性。泛基因組育種方法已經(jīng)在水稻、番茄等一些常見模式作物上取得了成功,并且正逐漸被應(yīng)用于小麥、高粱、土豆等非模式作物的遺傳改良。
圖1|茶的多樣性
為了更好地理解茶樹的遺傳特性和表型多樣性,基因組所張興坦課題組主導(dǎo),聯(lián)合國內(nèi)多家單位成功構(gòu)建茶樹首個(gè)泛基因組圖譜,完成了22個(gè)茶樹品種的測序并成功構(gòu)建茶樹泛基因組,并在此基礎(chǔ)上揭示了茶樹基因組中近期基因大規(guī)模擴(kuò)張的遺傳基礎(chǔ),并鑒定了多個(gè)參與茶樹葉色差異,芽期,香氣等多個(gè)重要農(nóng)藝性狀相關(guān)的遺傳變異,為茶樹重要基因挖掘和分子設(shè)計(jì)育種提供了重要參考。研究成果于2023年11月28日以“Gene mining and genomics-assisted breeding empowered by the pangenome of tea plant Camellia sinensis”為題發(fā)表在國際期刊《自然植物(Nature Plants)》上。
研究選取了22個(gè)能最大化代表茶樹遺傳多樣性和表型多樣性的茶樹品種,包括大葉茶(C.sinensis var.assamica,CSA),小葉茶(C.sinensis var.sinensis,CSS)和白毛茶(C.sinensis var.pubilimba(CSP))進(jìn)行測序組裝。分析發(fā)現(xiàn),茶樹基因組中有高達(dá)5萬至6萬個(gè)蛋白編碼基因,相較于已發(fā)表的版本(1–6),編碼基因數(shù)目增加了近20%。茶樹基因組包含大量的重復(fù)序列,其中長末端重復(fù)轉(zhuǎn)座子(LTRs)占據(jù)了基因組序列的50%以上。茶樹基因組一次近期的LTR爆發(fā)事件(LTRburst,約30-50萬年前)導(dǎo)致蛋白編碼基因的迅速擴(kuò)張(圖2)。
圖2.22個(gè)泛基因組測序的代表性茶樹品種。a.736份茶樹重測序主成分分析(PCA),揭示其遺傳多樣性。彩色點(diǎn)圖是用于泛基組分析的茶樹品種。b.22個(gè)代表性茶樹品種單拷貝基因(single-copygenes)的系統(tǒng)發(fā)育分析。C.sinensis var.assamica(CSA)樣品為紅色背景,C.sinensis var.pubilimba(CSP)樣品為黃色背景,C.sinensis var.sinensis(CSS)樣品為淺藍(lán)色背景。右圖顯示了CSA和CSS的形態(tài)學(xué)差異。
通過茶樹基因組的結(jié)構(gòu)變異分析,發(fā)現(xiàn)茶樹基因組中的結(jié)構(gòu)變異序列(SVs)大多源自于轉(zhuǎn)座元件(TEs),TE的高度活躍性產(chǎn)生了基因組中大量SV。此外,本研究揭示了SV如何影響茶葉的品質(zhì)特征,如葉色的多樣性。通過對茶樹的轉(zhuǎn)錄組和代謝數(shù)據(jù)的分析,發(fā)現(xiàn)不同品種之間的葉色差異主要與葉綠素、類黃酮、花青素等相關(guān)代謝物的含量有關(guān)。通過基因的SV分析,發(fā)現(xiàn)了結(jié)構(gòu)變異可能影響相應(yīng)代謝物的生物合成,從而造成了葉色的差異。比如,MYB114是調(diào)控花青素合成的一個(gè)重要轉(zhuǎn)錄因子,其啟動(dòng)子區(qū)域的一段LTR插入是形成茶樹紫葉的關(guān)鍵因素(圖3)。
圖3.影響茶樹葉色相關(guān)的功能性結(jié)構(gòu)變異。f.CsMYB114的示意圖。藍(lán)色矩形表示基因外顯子,紅色三角形指啟動(dòng)子的一段LTR插入。g.不同葉色品種CsMYB114啟動(dòng)子區(qū)域LTR插入的Read深度圖。紫葉品種(‘ZJ’,‘JMZ’,‘JGY’)的代表品種以及綠葉茶品種(‘FDDB’,‘BHZ’,‘GH3H’)。
芽期是(TBF)影響茶樹的一個(gè)關(guān)鍵經(jīng)濟(jì)性狀,培育早生優(yōu)質(zhì)茶樹品種是一個(gè)重要的育種目標(biāo)。本研究通過圖形泛基因組關(guān)聯(lián)分析(pan-GWAS)深入挖掘了與茶樹芽期相關(guān)的遺傳變異,鑒定出了與早芽萌發(fā)相關(guān)的QTL(qSPI4)(7)。同時(shí),新發(fā)現(xiàn)一個(gè)潛在參與早芽性狀(EBF)基因CYP72A9(圖4)。該研究揭示了pan-GWAS在識別茶葉性狀相關(guān)遺產(chǎn)變異的有效性。
圖4.基于圖形泛基因組的GWAS在挖掘茶樹TBF性狀相關(guān)關(guān)鍵基因中的應(yīng)用。a.曼哈頓圖顯示了TBF性狀的GWAS結(jié)果,包括SNP-GWAS和SV-GWAS。b.不同品種間DREB2A-like等位基因的序列比對。具有LBF性狀的個(gè)體表現(xiàn)為C基因型,而具有EBF性狀的樣本表現(xiàn)出A基因型。c.遺傳變異與染色體4上的EBF性狀之間的關(guān)聯(lián)分析。藍(lán)色矩形表示在染色體4上顯著標(biāo)記-性狀關(guān)聯(lián)的候選基因區(qū)域(227.490–227.520Mb)。d.EBF和LBF品種的DREB2A-like等位基因的系統(tǒng)發(fā)育分析。e.一個(gè)61kb的結(jié)構(gòu)變異(SV_2_83963),位于CsCYP72A9(TGY012913)的上游。f.群體分析支持CsCYP72A9上游的SV_2_83963與TBF性狀相關(guān)。
此外,結(jié)合圖形泛基因組、群體基因組學(xué)以及代謝組數(shù)據(jù)的綜合分析,本研究還鑒定到多個(gè)影響茶葉風(fēng)味性狀的等位變異,包括兒茶素合成,茶香氣合成的核心基因的等位變異,為茶樹分子育種改良提供了重要靶標(biāo)。
茶樹泛基因組圖譜的構(gòu)建更新了大眾對茶樹基因組的認(rèn)識,包括蛋白編碼基因數(shù)以及遺傳變異對茶樹表型的影響。該研究不僅為茶樹基因組和重要性狀的演化提供新見解,而且為茶樹重要基因挖掘和遺傳育種提供了重要平臺(tái)資源和信息,為加速茶樹育種進(jìn)入全基因組設(shè)計(jì)時(shí)代奠定了重要基礎(chǔ)。同時(shí)也為木本植物的生物學(xué)研究提供重要參考。
基因組所博士研究生陳帥、西北農(nóng)林科技大學(xué)王鵬杰教授、基因組所孔維龍副研究員以及客座碩士研究生柴琨為論文共同第一作者,基因組所張興坦研究員、福建農(nóng)林大學(xué)葉乃興教授和廣東省農(nóng)業(yè)科學(xué)院茶葉研究所吳華玲教授為論文共同通訊作者。此外,博士研究生張晟鋮、王毅斌、余嘉鑫、高瑩瑩、蔣夢薇、雷文龍、王文玲、陳曉、屈伸洋、王芳、王英豪、谷夢雅,以及基因組所博士后張清、廣東省農(nóng)業(yè)科學(xué)院茶葉研究所方開星博士、中國農(nóng)科院茶葉研究所馬春雷副研究員、福建農(nóng)林大學(xué)孫威江教授也參與了此項(xiàng)工作。該研究得到了廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃子項(xiàng)目、深圳市優(yōu)秀青年科學(xué)基金、國家優(yōu)秀青年科學(xué)基金的資助。
來源:中國農(nóng)科院基因組所,信息貴在分享,如涉及版權(quán)問題請聯(lián)系刪除